UDRB: Uma Nova Heurística Eficaz para Deduplicação de Referências Bibliográficas
نویسندگان
چکیده
Publicações cient́ıficas normalmente contêm referências bibliográficas a trabalhos anteriores. Tais referências são usadas como fonte de informação para bibliotecas digitais, contribuindo com recursos de busca, navegação e estimativa de qualidade das obras. Neste contexto, frequentemente ocorre um problema que consiste em identificar se duas referências representam uma mesma publicação, conhecido como deduplicação de referências bibliográficas (DRB). Soluções para DRB podem ser divididas em supervisionadas (dependem de um conjunto de treinamento) e não supervisionadas (baseados em heuŕısticas). Com objetivo de evitar o acentuado custo manual de criação de um conjunto de treinamento, propomos neste trabalho uma heuŕıstica não supervisionada para DRB, denominada UDRB. Os experimentos em bases reais mostraram que a heuŕıstica proposta alcançou ganhos de mais de 7% em relação ao método não supervisionado estado-da-arte, e eficácia similar as de métodos supervisionados na maioria dos casos, sem a necessidade da dispendiosa tarefa de rotulação manual.
منابع مشابه
Uma Avaliação de Eficiência e Eficácia da Combinação de Técnicas para Deduplicação de Dados
Data Deduplication is the task of identifying and eliminating duplicate records in a single database. It is a complex process that involves several steps, including: defining blocking key, similarity function and indexing method. There are several approaches for each of these steps. In this context, the objective of this work is to find the best combination for such algorithms aiming to improve...
متن کاملUma Abordagem Multi-Visão para a Estimativa de Qualidade de Artigos de Wikis
A Wikipédia é um exemplo de repositório de livre acesso e edição criado através do esforço colaborativo de sua comunidade de usuários. Porém, esta enorme quantidade de informação causa uma grande preocupação quanto à qualidade de seu conteúdo, dada a sua disponibilização absolutamente democrática. Para lidar com este problema, alguns trabalhos procuram estimar a qualidade dos artigos na Wikiped...
متن کاملHeurísticas para avaliar a usabilidade de aplicações móveis: estudo de caso para aulas de campo em Geologia
To evaluate the usability of mobile applications is necessary to consider the peculiarities of these devices, such as mobility, hardware constraints and context of use. In order to improve the usability evaluations of these applications, existing techniques are adapted so that these characteristics are taken into account. This paper presents the results of a study conducted to identify works th...
متن کاملUtilizando Avaliação Heurística para Avaliar a Usabilidade de uma Aplicação para Web
A demanda par qualidade em aplicaVo-es para Web fem se tornado crescente, pois a coda d!a aumenta a parcela do papuLado cam acessa `a Internet. AtuaLmenfe hd um cansensa que a qualidade do sistema coma um fade estd diretamenfe Iz"gada `a quaLidade do sua z"nfeace. Nesse confexta, um cancel.to chave e~ usabil!dade que estd facada em fazer sistemas eficienfes, ef!cazes e fa cez.s de usar. Mu!tas ...
متن کاملRedes Complexas Aplicadas no Reconhecimento de Faces
Este artigo apresenta uma nova metodologia para o reconhecimento de faces, um importante e difícil problema que tem sido estudado pela comunidade de visão computacional e reconhecimento de padrões. A metodologia utilizada modela a imagem de uma face através de uma rede complexa e medidas são extraídas sobre essas redes para a composição do vetor de característica. Os experimentos foram conduzid...
متن کامل